AI TNT— 让一部分先用AI实现商业化

谷歌揭秘大模型不会数r原因：嵌入维度是关键，不止分词器问题

大模型做奥赛题游刃有余，简单的数数却屡屡翻车的原因找到了。

来自主题: AI技术研报

8497 点击 2024-09-04 22:03

Claude认出自画像，惊现自我意识！工程师多轮测试，实锤AI已过图灵测试？

Claude又通过「图灵测试」了？一位工程师通过多轮测试发现，Claude能够认出自画像，让网友惊掉下巴。

来自主题: AI技术研报

7877 点击 2024-09-02 16:55

数学系本科生卧室手搓「核聚变反应堆」，Claude 3.5立大功！0基础，狂肝1个月

前段时间，Claude 3.5帮助右手骨折工程师一周肝出3000行代码。现在，又有00后数学系本科生借助AI，用了一个月时间，在自家卧室手搓「核聚变反应堆」，震惊一大波网友。

来自主题: AI资讯

3635 点击 2024-08-26 15:56

终于，Claude上线LaTeX公式渲染功能，评论区网友沸腾了

当 ChatGPT 老早就支持使用 LaTeX 语言输入和显示数学公式时，Claude 现在终于补上了这一功能。

来自主题: AI资讯

5891 点击 2024-08-23 15:33

VLM集体「失明」？视力测试惨败，GPT-4o、Claude 3.5全都不及格

视觉大语言模型在最基础的视觉任务上集体「翻车」，即便是简单的图形识别都能难倒一片，或许这些最先进的VLM还没有发展出真正的视觉能力？

来自主题: AI技术研报

8068 点击 2024-07-16 19:43

Claude 3.5核心编码prompt揭秘，全网码农沸腾！四步调教法，最新V2版放出

最核心的Claude 3.5编码系统提示，火遍Reddit社区。就在刚刚，原作者发布了进化后的第二版，有的网友已经将其加入工作流。

来自主题: AI技术研报

7916 点击 2024-07-16 19:36

菲尔兹奖得主亲测GPT-4o，经典过河难题破解失败！最强Claude 3.5回答离谱，LeCun嘲讽LLM

LLM能否解决「狼-山羊-卷心菜」经典过河难题？最近，菲尔兹奖得主Timothy Gowers分享了实测GPT-4o的过程，模型在最简单的题目上竟然做错了，甚至网友们发现，就连Claude 3.5也无法幸免。

来自主题: AI资讯

7843 点击 2024-07-01 12:21

Bengio团队提出多模态新基准，直指Claude 3.5和GPT-4o弱点

想要达成通用人工智能 AGI 的终极目标，首先要达成的是模型要能完成人类所能轻松做到的任务。为了做到这一点，大模型开发的关键指导之一便是如何让机器像人类一样思考和推理。诸如注意力机制和思维链（Chain-of-Thought）等技术正是由此产生的灵感。

来自主题: AI技术研报

6793 点击 2024-06-29 00:14

陈丹琦团队图表解读新基准：新王Claude3.5刚及格，但已是模型最强推理表现

Claude 3.5 Sonnet的图表推理能力，比GPT-4o高出了27.8%。针对多模态大模型在图表任务上的表现，陈丹琦团队提出了新的测试基准。新Benchmark比以往更有区分度，也让一众传统测试中的高分模型暴露出了真实能力。

来自主题: AI技术研报

7897 点击 2024-06-29 00:07

GPT-5一年半后拥有「博士级智能」，Claude 3.5首超人类博士！全知全能ASI将成人类「新神」？

OpenAI CTO Murati表示，GPT-5将在一年半后发布，在某些领域将达到博士的智能；而Claude 3.5 Sonnet，已经成为了第一个测试分数高于最聪明的人类博士的模型。当AGI进一步发展为ASI，它会因为接近神性的全知、全能、无所不在，而被人类敬奉为「新神」吗？当ASI给出一张「希特勒名单」，人类又将怎样？

来自主题: AI资讯

7863 点击 2024-06-22 22:14